智能论文笔记

Industry-Scale Orchestrated Federated Learning for Drug Discovery

Martijn Oldenhof , Gergely Ács , Balázs Pejó , Ansgar Schuffenhauer , Nicholas Holway , Noé Sturm , Arne Dieckmann , Oliver Fortmeier , Eric Boniface , Clément Mayer

分类：机器学习 | (统计)机器学习

2022-10-17

To apply federated learning to drug discovery we developed a novel platform in the context of European Innovative Medicines Initiative (IMI) project MELLODDY (grant n{\deg}831472), which was comprised of 10 pharmaceutical companies, academic research labs, large industrial companies and startups. The MELLODDY platform was the first industry-scale platform to enable the creation of a global federated model for drug discovery without sharing the confidential data sets of the individual partners. The federated model was trained on the platform by aggregating the gradients of all contributing partners in a cryptographic, secure way following each training iteration. The platform was deployed on an Amazon Web Services (AWS) multi-account architecture running Kubernetes clusters in private subnets. Organisationally, the roles of the different partners were codified as different rights and permissions on the platform and administrated in a decentralized way. The MELLODDY platform generated new scientific discoveries which are described in a companion paper.

translated by 谷歌翻译

Autonomous Drug Design with Multi-armed Bandits

Hampus Gummesson Svensson , Esben Bjerrum , Christian Tyrchan , Ola Engkvist , Morteza Haghir Chehreghani

分类：机器学习

2022-07-04

人工智能和自动化方面的最新发展可能会导致新的药物设计范式：自主药物设计。在此范式下，生成模型就具有特定特性的数千个分子提供了建议。但是，由于只能合成和测试有限数量的分子，因此一个明显的挑战是如何有效选择这些分子。我们将这项任务作为上下文随机的多军强盗问题，具有多个戏剧和挥发性臂。然后，为了解决它，我们将以前的多臂匪徒扩展到反映这种设置，并将我们的解决方案与随机采样，贪婪的选择和腐烂的epsilon-greedy选择进行比较。为了研究不同选择策略如何影响选择的累积奖励和多样性，我们模拟了药物设计过程。根据仿真结果，我们的方法具有更好地探索和利用自主药物设计的化学空间的潜力。

translated by 谷歌翻译

Implications of Topological Imbalance for Representation Learning on Biomedical Knowledge Graphs

Stephen Bonner , Ufuk Kirik , Ola Engkvist , Jian Tang , Ian P Barrett

分类：机器学习 | 人工智能

2021-12-13

改善疾病的护理标准是关于更好的治疗方法，反过来依赖于寻找和开发新药。然而，药物发现是一个复杂且昂贵的过程。通过机器学习的方法采用了利用域固有的互连性质的药物发现知识图的创建。基于图形的数据建模，结合知识图形嵌入式提供了更直观的域表示，适用于推理任务，例如预测缺失链路。一个这样的例子将产生对给定疾病的可能相关基因的排名列表，通常被称为目标发现。因此，这是关键的，即这些预测不仅是相关的，而且是生物学上的有意义的。然而，知识图形可以直接偏向，由于集成的底层数据源，或者由于图形构造中的建模选择，其中的一个结果是某些实体可以在拓扑上超越。我们展示了知识图形嵌入模型可能受到这种结构不平衡的影响，导致无论上下文都要高度排名的密集连接实体。我们在不同的数据集，模型和预测任务中提供对此观察的支持。此外，我们展示了如何通过随机，生物学上无意义的信息扰乱图形拓扑结构以人为地改变基因的等级。这表明这种模型可能会受到实体频率而不是在关系中编码的生物学信息的影响，当实体频率不是基础数据的真实反射时，创建问题。我们的结果突出了数据建模选择的重要性，并强调了从业者在解释模型输出和知识图形组合期间时要注意这些问题。

translated by 谷歌翻译

A Review of Biomedical Datasets Relating to Drug Discovery: A Knowledge Graph Perspective

Stephen Bonner , Ian P Barrett , Cheng Ye , Rowan Swiers , Ola Engkvist , Andreas Bender , Charles Tapley Hoyt , William L Hamilton

分类：人工智能

2021-02-19

药物发现和发展是一个复杂和昂贵的过程。正在研究机器学习方法，以帮助提高药物发现管道多个阶段的有效性和速度。其中，使用知识图表（kg）的那些在许多任务中具有承诺，包括药物修复，药物毒性预测和靶基因疾病优先级。在药物发现kg中，包括基因，疾病和药物在内的关键因素被认为是实体，而它们之间的关系表示相互作用。但是，为了构建高质量的KG，需要合适的数据。在这篇综述中，我们详细介绍了适用于构建聚焦KGS的药物发现的公开使用来源。我们的目标是帮助引导机器学习和kg从业者对吸毒者发现领域应用新技术，但是谁可能不熟悉相关的数据来源。通过严格的标准选择数据集，根据包含内部包含的主要信息类型，并基于可以提取的信息来进行分类以构建kg。然后，我们对现有的公共药物发现KGS进行了比较分析，并评估了文献中所选择的激励案例研究。此外，我们还提出了众多和与域及其数据集相关的众多挑战和问题，同时突出了关键的未来研究方向。我们希望本综述将激励KGS在药物发现领域的关键和新兴问题中使用。

translated by 谷歌翻译

A Literature Review on Length of Stay Prediction for Stroke Patients using Machine Learning and Statistical Approaches

Ola Alkhatib , Ayman Alahmar

分类：机器学习 | 人工智能

2021-12-30

医院住宿时间（LOS）是最重要的医疗保健度量之一，反映了医院的服务质量，有助于改善医院调度和管理。LOS预测有助于成本管理，因为留在医院的患者通常在资源受到严重限制的情况下这样做。在这项研究中，我们通过机器学习和统计方法审查了LOS预测的论文。我们的文献综述考虑了对卒中患者LOS预测的研究研究。一些受访的研究表明，作者达成了相应的结论。例如，患者的年龄被认为是一些研究中卒中患者LOS的重要预测因子，而其他研究则认为年龄不是一个重要因素。因此，在该领域需要额外的研究以进一步了解卒中患者LOS的预测因子。

translated by 谷歌翻译

Off-line approximate dynamic programming for the vehicle routing problem with a highly variable customer basis and stochastic demands

Mohsen Dastpak , Fausto Errico , Ola Jabali

分类：人工智能

2021-09-21

我们研究了在国内捐助服务服务中引起的车辆路由问题的随机变体。我们考虑的问题结合了以下属性。就客户是随机的，但不仅限于预定义的集合，因此请求服务的客户是可变的，因为它们可能出现在给定的服务领域的任何地方。此外，需求量是随机的，并且在拜访客户时会观察到。目的是在满足车辆能力和时间限制的同时最大化预期的服务需求。我们将此问题称为VRP，具有高度可变的客户基础和随机需求（VRP-VCSD）。对于这个问题，我们首先提出了马尔可夫决策过程（MDP）的配方，该制定代表了一位决策者建立所有车辆路线的经典集中决策观点。虽然结果配方却很棘手，但它为我们提供了开发新的MDP公式的地面，我们称其为部分分散。在此公式中，动作空间被车辆分解。但是，由于我们执行相同的车辆特定政策，同时优化集体奖励，因此权力下放是不完整的。我们提出了几种策略，以减少与部分分散的配方相关的国家和行动空间的维度。这些产生了一个更容易解决的问题，我们通过加强学习来解决。特别是，我们开发了一种称为DECQN的Q学习算法，具有最先进的加速技术。我们进行了彻底的计算分析。结果表明，DECN的表现大大优于三个基准策略。此外，我们表明我们的方法可以与针对VRP-VCSD的特定情况开发的专业方法竞争，在该情况下，客户位置和预期需求是事先知道的。

translated by 谷歌翻译